查看原文
其他

你了解多少博弈论?从社会经济到人工智能,博弈论无处不在!(中)


世界图书出版公司即将重磅推出“世界博弈论经典”系列,包括多位诺贝尔奖得主著作在内的几十部世界经典名著将陆续与读者见面。


在上周一的文章里我们介绍了博弈论中的一个重要思想——Minimax,以及它在人工智能中的应用。



博弈论真正成为显学最大的用武之地是在经济学。1944年,在经济学家奥斯卡·摩根斯特恩(Oskar Morgenstern)的协助下,冯·诺依曼的经典名著《博弈论和经济行为》出版了,这是一部数理经济学的奠基性著作。书中将二人博弈进一步推广到多人博弈结构并将博弈论系统地应用于经济领域。



冯·诺依曼和摩根斯坦恩当时都在普林斯顿任教,普林斯顿很快成为了博弈论研究的世界中心,这也是为什么1948年纳什选择到普林斯顿大学读博士,在苦苦思索了多年后,纳什建立了全新的博弈论概念:均衡(Equilibrium)。



我们用著名的“囚徒困境”的例子来解释下什么是均衡。


警察逮捕了A、B两名嫌疑犯,警察向两人提供了相同的选择:


若一人认罪并作证检举对方,而对方保持沉默,此人立即获释,不主动认罪的另一方将判监20年;若二人都保持沉默,则二人都判监1年;若二人都互相检举对方,则二人都判监5年。


从双方共同利益角度来看,两人均保持沉默是最好的选择。但两人提前不能互相交流,并不能保证对方不会检举自己,这就陷入了囚徒困境。从单方面自身利益出发,在对方保持沉默的情形下,选择检举对方能使自己的刑期从1年减为0年;在对方检举自己的情形下,选择检举对方也能使自己的刑期从20年减为5年。所以无论在哪种情况下,检举对方都能使自己的利益最大化,是优势策略(即无论其他参与者选择什么策略,这一策略对一个参与者来说都是最优的策略)。这就导致了“囚徒困境”唯一可能达到的均衡,就是双方都选择检举对方,结果是二人都被判监5年。



在二人零和博弈中,“最小最大解”和“纳什均衡”的结果是一致的。回想一下上期中切蛋糕的例子。两个孩子分一个蛋糕,其中一个孩子负责把蛋糕切成两块,但另一个孩子可以先选要哪一块蛋糕,切蛋糕的孩子知道另一个孩子会选大的那块(也就是留给自己的肯定是小的那块),所以他会把较小的一块切得尽量大(使自己的最小收益达到最大或者说最大损失达到最小),切蛋糕问题的“最小最大解”就是把蛋糕切成一样大的两块,两人各分得半个蛋糕。


我们从“纳什均衡”的角度再来看这个切蛋糕问题,第一个孩子假设自己把蛋糕切成不一样大小的两块,第二个孩子自然会选大块,这时,两个孩子会分别问自己一个问题:这样选择你后悔吗(即是不是选择了优势策略)?第二个孩子想:我得到了大块,我不后悔!第一个孩子想:如果我切成一样大的两块,我能得到的更多,我后悔了!于是第一个孩子改变策略,切成一样大的两块,还是重复刚才的问题,你后悔吗?第二个孩子想:既然两块蛋糕一样大,挑哪块都一样,我不后悔!第一个孩子想:既然第二个孩子总是选择大块的,我能得到半块蛋糕已经是最好的结果了,我也不后悔!当两人都不后悔时,纳什均衡就达成了!


进一步把二人博弈推广到多人博弈,冯·诺依曼考虑的推广方式是合作博弈,他假定多人间会结成联盟,形成两队来互相博弈,这样队与队间就能继续应用二人零和博弈的方法了,队内则是一种合作的状态,每个人的策略依赖于与队内其他人的协调。这样的推广使冯·诺依曼的博弈论在方法上存在着内在的矛盾,有着严重的局限性。纳什突破了这种局限性,他从数学上证明了在多人博弈时,任何使每人自身利益最大化的非合作博弈都存在均衡点。均衡的概念奠定了现代主流博弈理论和经济理论的基础。“纳什带领社会科学走向了一个新的世界,使对任何情况下的冲突和合作的研究有了统一的分析方法。”2007年诺贝尔经济学奖得主罗杰·迈尔森(Roger Myerson)这样写道,“纳什创立的非合作博弈理论已经发展成了一种有效衡量动机的方法,它能帮助我们更好地了解在任何社会、政治或是经济背景下的冲突和合作问题的实质。”


下面这个视频就是用“纳什均衡”来解释为什么麦当劳旁总有一个肯德基,耐克店旁总有一个阿迪达斯,或经常能发现好几家咖啡店开在同一个街角。



“纳什均衡”中总是假设每个人都在追求自己的利益最大化,任何人都不会损己利人。这样的社会其实会导致一些糟糕之处。我们来看一下“环保博弈”问题:

世界上有100个国家,每个国家在选择放任环境污染不管和积极治理环境污染中做选择。如果有一个国家选择放任污染,那么世界上每个国家的成本都+1;如果某个国家选择积极治理环境,那么其他国家的成本不变,它自己国家的成本需要+3。


很容易看出来,如果大家都积极治理,那么每个国家的成本都是3,所花的成本并不高。但如果一个国家从自身利益出发,选择放任污染(比如某国宣布退出巴黎气候协定),那它自己的成本只有1,其他国家的成本都是4。如果所有国家都这样想,大家都选择撂挑子,那么结果就变成每个国家的成本都是100,出现的是最糟糕的情况。



“纳什均衡”的结果给我们带来警示!耶鲁大学的著名博弈论专家约翰·罗默尔通过换位思考(即假想如果别人都和自己一样行动,自己该怎么做),提出了一种合作博弈的新均衡——“康德均衡”。“康德均衡”是“世界博弈论经典”中一本最新著作的主题,书中罗默尔教授会全面阐述他的新观点。


在另一方面,纳什虽然从数学上证明了均衡点必然存在,却并没有指出如何去找出均衡点。下一期中我们会由此展开来谈谈“算法博弈论”这个计算机科学领域的研究新热点。此外,像拍卖模型和拍卖机制需要经济学家与计算机科学家共同合作来设计;区块链和电子货币的安全性也需要从博弈论角度去考虑;网络资源分配需要博弈论,激励网络合作的协议设计需要博弈论,甚至信息如何在社交网络中传播也需要从博弈论的角度去分析。


博弈论其实已经成为我们研究世界的一种工具。目前世界各大名校的经济系、计算机系、电子工程系、数学系、生物学系,还有心理学系、政治科学系和社会科学系的课程中都含有博弈论的内容。
【相关链接】你了解多少博弈论?从社会经济到人工智能,博弈论无处不在!(上)



世界图书出版公司推出的“世界博弈论经典”分为“经济与社会科学系列”和“计算与信息科学系列”两个子系列,这些经典名著的作者中有诺贝尔经济学奖得主让·梯若尔(Jean Tirole)和罗杰·迈尔森(Roger Myerson),以及呼声很高的诺贝尔奖候选人、“博弈论四君子”中的阿里尔·鲁宾斯坦(Ariel Rubinstein)和肯·宾默尔(Ken Binmore)等。
几十本经典名著即将来袭,敬请期待!
其中的第一本,诺贝尔经济学奖得主让·梯若尔(Jean Tirole)和美国科学院院士朱·弗登伯格(Drew Fudenberg)合著的《博弈论》,已在世图淘宝官方旗舰店首发销售。




(▲感兴趣的读者欢迎打开淘宝app扫一扫上面的二维码购书~~)



公号ID:wpcbj1986世 图 好 书

把世界介绍给中国

把中国介绍给世界

科技|人文|心理|外语|动漫

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存